数据治理之——数据标准体系建设示例

1.1.1 数据标准体系建设
数据标准是企业级的业务规范,用于指导各业务系统及数据仓库的建设依据,元数据是系统级的描述手段,更多的反映系统建设情况;数据标准指导系统建设的成果可以通过元数据来反映,系统的建设反过来可促进数据标准的完善。
配合数据标准落地搭建相关的数据标准管理平台,用户管理和维护数据标准,并提供数据标准的查询浏览和导出等相关功能,标准监控通过数据质量监控平台完成。如下图所示:

图 6.1 2数据标准制定流程
1.1.1.1 数据标准的编制
目前XX区各部门的电子政务系统建设,主要是以功能为核心,体现的是部门级的管理要求和管理水平,缺乏区一级的数据标准,各系统建设难免出现异构现象。数据格式、类型不一致,数据质量问题突出,难以提供信息共享和业务协同的数据支撑。建立完整、系统、准确、合规的区级数据标准是实现信息系统逻辑集中,实现有效深度智能挖掘的必要条件,充分发挥标准化建设的“统一规范”作用,有效瓦解并防范“信息孤岛”和条块分割的重复信息系统建设。
数据标准体系建设涉及部门多,且存在跨部门、跨系统的数据交换,各系统建设难免出现异构现象,数据格式、类型不一致,数据质量问题突出。统一标准是各局点之间互联互通、信息共享、业务协同的基础,结合电子政务建设的实践体会,运用先进适用的信息技术建设区数据中心,通过顶层设计和统筹规划,建立针对区数据中心的大数据标准体系,从根本上解决各部门各系统数据存在的不标准、不完整、重复、错误、不一致等数据质量问题,使数据在整合、应用的过程中实现统一标准的管理,达到提升整体数据质量、实现信息共享、信息交换、信息关联的目的。
1.1.1.1.1 标准制定思路
按照遵从上位标准、完善本地标准、补充空白标准、标准指导应用的原则,数据标准建设总体思路如下图所示:

图 6.1 3数据标准体系建设思路
1、遵从上位标准:数据标准编制前,要对现有各类数据标准进行梳理,包括:业务涉及到的国家标准、地方标准和行业标准,以及XX区已经颁布的标准;
2、完善本地标准:对XX区现有标准不完善的地方进行补充和升级,以适应业务发展需要;
3、补充空白标准:对于XX区各部门业务执行过程中约定俗成的各种数据分类和标准进行梳理和提取,新建标准;
4、指导应用:数据标准的制定是用来指导应用的。根据国家标准规范要求,数据标准核心内容主要由数据元目录和代码集两部份组成,其中数据元目录用于指导平台的元数据库建设,代码集用于指导平台的标准维度库建设,这两个数据库是平台的基础库,所有经过标准化清洗,进入平台的数据都由这两个库中的数据进行登记和描述,即,所有入库数据必须遵循数据标准。
1.1.1.1.2 数据元目录建设
数据元是通过定义、标识、表示以及允许值等一系列属性描述的数据单元。通过对数据元及其属性的规范化和标准化,不同用户可以对数据拥有一致的理解、表达和标识,可以有效实现和增进跨系统和跨环境的数据共享。
XX区电子政务业务数据元是在一定的业务环境中最小的数据单元,是将政务业务主体(如人口、法人、房屋)、政务数据行为(如证照内容、领取登记)、业务处理状态(如审核、批复、冻结)作为对象,对其在电子政务管理中应用到的特性(如项目的类别、行政事项类别等)和表示(如名称、代码、金额)进行标准化的结果,如“项目类别名称”、“资金性质代码”等。数据元目录是以目录形式排列的电子政务数据元的集合。为了便于数据元的理解和应用,应当将政务管理工作中用来表示业务对象的基本概念(如“项目”)作为政务管理中的一个术语加以规范化,给出标准、规范的说明或描述。
数据对象举例如下:
表 6.1 1数据对象
序号 数据对象 数据元
1 人口 姓名、身份证件名称、身份证件号码、照片、性别、性别代码、民族、民族代码、出生日期、婚姻状况、健康状况、国籍、从业状况、职业、工作单位、月收入、专业技术职务、职务、政治面貌等。
2 法人 机构名称、组织机构代码、工商注册号、国税税务登记号、地税税务登记号、机构类型、经济类型、行业名称、行业代码、隶属关系、负责人、法定代表人等
3 日期/时间 日期、时间、期限、年季度
4 公文 秘密等级、保密期限、紧急程度、发文机关标识、发文机关、发文机关代字、发文年号、发文序号、成文日期、签发人、公文标题、公文正文等
5 其他 货币名称、金额、银行名称、账户名称、支票号等
数据元举例说明(以“姓名”为例):
表 6.1 2数据元
序号 数据元项 描述
1 中文名称 姓名
2 内部标识符 01001
3 英文名称 name
4 中文全拼 xing-ming
5 定义 在公安户籍管理部门正式登记注册、人事档案中正式记载的中文姓氏名称。
6 对象类词 人
5 表示词 名称
6 数据类型 字符型
7 数据格式 a…30
8 版本 记录版本
9 备注 人的姓和名中间不应存在空格。
1.1.1.1.3 代码集建设
代码表是能够完整表达特定业务对象某个特性的全部值的集合,在XX区政府业务管理中,代码表一般与对应的数据元配套使用,作为数据元表示中的值域,可以对值域进行简洁和统一的表示和管理。代码表可以说是在电子政务数据元规范化和标准化过程中产生的,同时又有助于电子政务数据元的理解和应用的配套标准。例如,将项目按照规定的类别进行分类,并为每一类赋予一个代码,形成项目类别代码表。代码集是以目录形式表达的数据元目录中代码型值域所使用的代码表的集合,其中,每一个代码表除了规定每一项的名称、代码以及必要的说明外,还应根据需要给出必要的分类原则和编码方法。
代码表项举例说明:
表 6.1 3性别代码
代码 数据元名称 代码 数据元名称
0 未知的性别 2 女
1 男 9 未说明的性别

表 6.1 4民族代码
代码 名称 代码 名称
01 汉族 29 柯尔克孜族
02 蒙古族 30 土族
03 回族 31 达斡尔族
04 藏族 32 仫佬族
05 维吾尔族 33 羌族
06 苗族 34 布朗族
07 彝族 35 撒拉族
08 壮族 36 毛南族
09 布依族 37 仡佬族
10 朝鲜族 38 锡伯族
11 满族 39 阿昌族
12 侗族 40 普米族
13 瑶族 41 塔吉克族
14 白族 42 怒族
15 土家族 43 乌孜别克族
16 哈尼族 44 俄罗斯族
17 哈萨克族 45 鄂温克族
18 傣族 46 德昂族
19 黎族 47 保安族
20 傈僳族 48 裕固族
21 佤族 49 京族
22 畲族 50 塔塔尔族
23 高山族 51 独龙族
24 拉祜族 52 鄂伦春族
25 水族 53 赫哲族
26 东乡族 54 门巴族
27 纳西族 55 珞巴族
28 景颇族 56 基诺族

表 6.1 5身份证件类型代码
代码 数据元名称 代码 数据元名称
0 中华人民共和国居民身份证 1 户口簿
2 护照 3 军官证
4 士兵证 5 港澳居民来往内地通行证
6 台湾同胞来往内地通行证 7 临时身份证
8 外国人居留证 9 警官证
10 港澳台身份证 11 回乡证
12 驾驶证 13 社会保障卡
14 居住证 999 其他
1.1.1.1.4 数据标准编制过程
1.1.1.1.4.1 国标、地标、行业数据标准等收集
依据国标、地标、行业数据标准规范要求,结合XX区政务数据的实际情况,收集、整理、编制政务数据,例如GB11643-1999《公民身份号码》、GB/T3304-1991《中国各民族名称的罗马字母拼写法和代码》、GB/T4658-1984《文化程度代码》、GB/T4754-2002《国民经济行业分类》、GB/T4761-1984《家庭关系代码》、GB/T4762-1984《政治面貌代码》分别对公民身份号码、民族、文化程度、国民经济行业分类、家庭关系、政治面貌的编码及规则做出了规定。
相关标准清单如下:
表 6.1 6标准清单
序号 标准号 标准名称
1 GB/T2260-2002 中华人民共和国行政区划代码
2 GB/T2261.1-2003 个人基本信息分类与代码第1部份:人的性别代码
3 GB/T2261.2-2003 个人基本信息分类与代码第2部份:婚姻状况代码
4 GB/T2261.3-2003 个人基本信息分类与代码第3部份:健康状况代码
5 GB/T2261.

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值